Skip to main content

5.5.1 Modelldiagnostikk

Du kan teste din IV-regresjonsmodell gjennom å bruke opsjonene firststage, endog eller overid.

  • firststage (første stadium regresjonsstatistikk): Test for svake instrumenter. Vurderer styrken på korrelasjonen mellom instrumentene og instrumentvariabelen(e). Hvis korrelasjonen er svak, kan IV-estimatene være biased (skjeve) og ha store standardfeil. Høy F-verdi/lav P-verdi betyr at instrumentene forklarer variansen i instrumentvariabelen(e) og at intrumentvariabel-leddet er riktig å bruke.

  • endog (endogenitetstest): Test for om instrumentvariabelen(e) faktisk er endogen. Lav P-verdi betyr at instrumentvariabelen(e) er endogen(e) og at en IV-modell er nødvendig. P-verdi over grenseverdi betyr at OLS (regress) er tilstrekkelig.

  • overid (overidentifiseringstest): Dersom din modell har flere instrumenter enn instrumentvariabler, har du et tilfelle med overidentifiserende instrumenter. Testen sjekker om overskuddsinstrumentene er ukorrelerte med feilleddet i regresjonsligningen. Høy P-verdi betyr at instrumentene er gyldige og kan brukes. For at instrumentene skal være gyldige, bør de være korrelert med intrumentvariabelen(e), men ikke med den avhengige variabelen (Y). Merk at testen ikke returnerer noen verdi dersom antallet instrumenter = antallet instrumentvariabler, f.eks. dersom du har én instrumentvariabel og ett instrument.

Eksempel:

I eksempelet over brukes standard "two-stage least squares" estimeringsmetode med formue som instrumentvariabel, mens alder og "høy utdanning" er instrumenter. Vi antar altså at alder og "høy utdanning" påvirker formue. Første stadium regresjonsstatistikken viser at det faktisk er en korrelasjon. Endogenitetstesten viser dessuten at formue er endogen og at det er riktig å bruke en IV-regresjonsmodell. Overidentifiseringstesten returnerer en lav P-verdi (0), noe som derimot betyr at instrumentene ikke er gyldige. Årsaken til dette er høyst sannsynlig at alder og "høy utdanning" er korrelert med Y-variabelen lønn i tillegg til formue, noe som ikke er optimalt.

Det er også mulig å teste modelleringen på følgende måter:

  • Kjøre regresjon med og uten instrumentering, og sammenligne resultatet: regress vs. ivregress

  • Bruke kommandoen correlate til å sjekke for korrelasjon mellom utvalgte variabler

  • Studere residualer m.m. vha. kommandoen ivregress-predict